XX. mendeko Euskararen Corpus estatistikoa

Testuingurua

Modu grafikoan, honek, kasuen % 95ean, batezbestekoa kalkulatzen dudanean, konfiantza tartea eraikitzen badut, benetako batezbestekoa, lagineko batezbestekoa erabiliz eraiki dudan tartean egongo da % 95eko konfiantza-mailarekin.

Kanpoan geratuko da kasuen % 5etan.

Arazo bakar bat dago.

Ikertzaileak batezbesteko bakar bat kalkulatuko du ikerketa bakoitzean, eta konfiantza-tartea % 95ean eraikitzen duenean, ez daki benetako batezbestekoa konfiantza-tartearen barruan sartzen den (kasuen % 95ean gertatuko dena) edo hanka sartzen ari ote den (kasuen % 5ean gertatuko dena) asteriskoekin (*****) adierazi dudan tartean bezala.

Hau da konfiantza tarteekin lan egiteko modua.

Baina ziurrago egon nahi badut, % 99an adibidez, konfiantza-tartea luzeagoa izango da, zehaztasuna txikiagoa izango da baina gutxiagotan nahastuko naiz.

Kasu honetan, adibideko datuekin: batezbestekoa 72 eta desbideratze tipikoa 9 (errore estandarra 0.9).

Tarteak % 95, % 99 eta % 999 konfiantza-mailetan, hauek izango dira:

Konfiantza-maila / TARTEA / Errore-maila

Konfiantza-maila handituz doan neurrian, errore-maila jaisten dela ikusten dugu baina, noski! tartearen luzera handitzen da.

Zer egin behar dut zehaztasun handiagoa nahi badut? (tartearen luzera txikiagotu nahi badut?)

LAGINAREN TAMAINA HANDITU. Laginaren tamaina handitzen badut, eta lagina ongi aukeratzen dudan guztietan, hau, lagina, populazioaren adierazgarriagoa izango dut, eta honek estimazioa gehiago fintzen lagunduko dit. Ekintza hau formulara itzultzen da, errore estandarra gutxituz.

Baina ZER DA KONFIANTZA-TARTE edo INTERBALOA?

Definitzeko garaian gauza asko esan daitezke. Baina lagin aleatorio sinplea burutu eta laginaren batezbestekoa kalkulatu ondoren bi definizio eman ditzaket:

1.- Emandako konfiantza-maila edo tartearekin, populazioaren batezbestekoak balio dezakeen balioen multzoa da.

2.- Hipotesi onargarrien multzoa da. Tartean ez dauden balioak, baliagarri bezala ezingo ditut onartu.

Ondoren, estatistika inferentzialarekin erantzun ditzakegun galdera mota ezberdinak aztertzera pasako gara.

Aurreko atalean aztertutako konfiantza tarteak beste ikuspuntu batetik aurkeztuz hasiko gara.

6.2. EMAITZEN OROKORPENA: KONFIANTZA-TARTEAK

Lagin baten emaitzak populazio osoarekiko orokortu nahi ditugunean, errore-maila delakoaren arriskuaz jabetu behar dugu.

Errore maila hori, ikertzen dugun populazioaren azpipopulazio bateko datuekin ibiltzean datza eta, behaturiko emaitzak populazio-emaitzak estimatzeko baliagarriak badira ere ezin dezakegu ziurtasun osoz populazio-emaitzak berberak direnik esan.

Errore-mailak probabilitate eremura garamatza, hots, probabilitate-hitzak erabili behar ditugu.

Adibidez, lagineko subjektuen batez besteko altuera 155 cm-koa bada, ondorengo bi eratara mintza gaitezke.

Lehena 155 cm populazioari dagokion batezbestekoa dela esatea, eta hau arriskutsuagoa izateaz aparte ez litzateke estatistikoegia izango.

Prozedura horri puntu-estimazioa esaten diogu eta egiten dugun hurbilketa edo estimazioa, puntu baten balioa ematea izango da.